Фрагмент для ознакомления
2
Элементы кластерного анализа в оценке рисков
Дано: двумерная совокупность данных, характеризующая экономическую деятельность хозяйствующего субъекта.
Например: оценка доходности и рискованности некоторой совокупности активов.
Доходность активов, % Рискованность активов,
стандартное отклонение доходности, %
4,948 1,015
5,788 1,929
3,337 8,922
4,354 9,644
6,083 4,982
1,784 1,326
5,852 8,204
3,866 4,869
6,994 2,660
3,123 3,551
5,488 5,444
4,656 9,213
4,783 8,927
1,437 8,171
2,573 8,542
2,581 9,458
2,319 2,778
6,398 1,050
4,896 4,301
3,790 7,728
3,479 2,132
3,952 4,700
Осуществить: кластеризацию объектов, указать причины сформированного разбиения, предложить рекомендации по управлению ими.
Кластерный анализ в управлении рисками
Методы кластерного анализа позволяют построить классификации многомерных данных, выявить внутренние связи между единицами наблюдаемой совокупности, а также могут использоваться с целью сжатия информации [1; 2; 3]. В кластерном анализе используются различные меры расстояния d (X i , X j ) между объектами. В нашем случае использовано Евклидово расстояние(Euclidean distances):
n
d (X i , X j ) (xik x jk )2
k 1
Из всех методов кластерного анализа самыми распространенными являются иерархические агломеративные методы. Сущность этих методов заключается в том, что на первом шаге каждый объект выборки рассматривается как отдельный кластер. Процесс объединения кластеров происходит последовательно: на основании матрицы расстояний или матрицы сходства объединяются наиболее близкие объекты. Если матрица сходства первоначально имеет размерность m х m, то полностью процесс кластеризации завершается за m – 1 шагов, в итоге все объекты будут объединены в один кластер. Последовательность объединения легко поддается геометрической интерпретации и может быть представлена в виде графа. Воспользуемся агломеративным иерархическим алгоритмом классификации. В качестве расстояния между объектами примем обычное евклидовое расстояние. Тогда согласно формуле:
p(xij) = ∑(xil-xji)2
где l - признаки; k - количество признаков
p(x1,2) = (4.948-5.788)2 + (1.015-1.929)2 = 1.24
p(x1,3) = (4.948-3.337)2 + (1.015-8.922)2 = 8.07
p(x1,4) = (4.948-4.354)2 + (1.015-9.644)2 = 8.65
2. Полученные данные помещаем в таблицу (матрицу расстояний).
Фрагмент для ознакомления
3
1. Кластеризация цифровой экономики: теория и практика : монография / под ред. д-ра экон. наук, проф. А. В. Бабкина. – СПб. : ПОЛИТЕХ-ПРЕСС, 2020 – 807 с.
2. Дуплякин В.М., Болдырев М.А. Кластерный анализ переменных в моделях оценки риска неисполнения обязательств по облигациям на рынке ценных бумаг // Вестник Самарского государственного университета. Серия «Экономика и управление», 2015. № 9/ 2 (131). С. 292-300.
3. Валинурова А.А. Теоретическое обоснование использования метода кластеризации в банковском резервировании // Ивэкофин, 2021. №02(48) С. 17-22.